扫描下载APP
其它方式登录
文章围绕AI自进化(Recursive Self-Improvement)展开,探讨其技术内涵、当前进展与落地路径,聚焦基模训练、harness(驾驭工程)、长期记忆等关键环节的进化实践;同时深入分析安全可控性、动态评测体系缺失、人机协同演化等挑战,并指出AI自进化正推动技术范式从量变走向质变,或将重塑工作模式、教育形态与人类认知发展。
AI编程范式正从手动编写Prompt转向Loop Engineering(循环工程),即设计自动化工作流系统,由Automations、Worktrees、Skills、Plugins/Connectors和Sub-agents五大模块构成,并依赖外部记忆层持续运行。该模式强调将工程师的判断力前置到系统设计中,提升开发杠杆,但不替代人工验证与理解,核心挑战在于避免认知投降和理解债。
AI编程范式正从手动提示词工程转向Loop Engineering,即开发者设计具备反馈闭环的循环系统来持续调度、验证和约束编程Agent。Claude Code创始人Boris Cherny与OpenAI工程师Peter Steinberger共同推动该趋势,强调通过/loops和Routines等原生机制实现长时间自主开发任务,但面临Token成本高、调试复杂及上下文衰减等现实挑战。
文章基于Anthropic公开的Skill方法论,反思当前AI技能(Skill)设计中的常见误区,强调Skill本质是上下文工程(Context Engineering),应聚焦沉淀隐性经验(Gotchas)、结构化组织知识(如references/scripts/examples/assets)、用脚本替代重复推理、将Description作为意图路由规则,并采用轻量分发机制验证Skill真实价值。
文章介绍一种以终端命令行和plan.md文件为核心的智能体工程工作流,强调Research→Plan→Work三阶段循环,人专注方向制定与计划审查,AI代理负责执行,旨在提升大型项目开发效率,同时分析其适用边界与潜在风险。
文章系统阐述了Agentic Engineering(智能体工程)这一新型开发范式,作者通过个人实践展示如何利用AI Agent重构软件开发与知识工作流程:以plan.md为核心进行结构化规划,用语音输入、多会话并行、Claude与Codex分工协作、上下文增强(笔记/会议/代码库)、可复用技能沉淀等方式提升生产力,并反思执行成本下降后人类价值应转向问题定义、方向判断与最终决策。
DeepSeek选择量化交易专家崔添翼主导Harness研发,凸显其战略重心从模型性能转向AI Agent工作流执行系统;Harness本质是将大模型能力稳定、安全、高效转化为生产力的工程系统,核心在于上下文管理、工具调用、风控与反馈闭环,而非单纯依赖模型参数规模。
文章探讨AI多智能体系统(MAS)的两条发展路径:一是当前主流的Harness式MAS,即多个AI角色协同完成任务的工作流引擎模式;二是更具颠覆性的Protocol-Native Agent System,强调个人专属Agent或‘无人公司’具备长期身份、主权、利益边界与协议化协作,主张AI系统将从软件工程范式转向数字社会范式,核心演进方向是Protocol Engineering而非Prompt Engineering。
文章指出AI竞争焦点正从大模型本身转向Harness(智能体系统工程层),即连接模型与真实业务场景的中间层。Harness决定模型能力的兑现效果,正在重塑AI产业链三层结构(基础设施、模型、应用),驱动算力需求变化,并在代码、CRM、办公等垂直场景中分化演进。标准化协议(如MCP、A2A、ATH)和协作基础设施成为新竞争高地。
文章探讨Harness Engineering(挽具工程)作为AI-First组织转型的核心范式,强调从将AI视为工具转向让AI主导生产力,通过动态自优化系统实现开发流程极致提效(如六周工作压缩至一天)、组织架构重构(取消专职产品经理)、角色重定义(人转向系统架构与价值判断),并指出转型关键在于建立对AI的信任及构建安全、可进化的Agent系统。
DeepSeek在获得700亿元融资后,战略重心转向AI Coding领域,全力推进桌面端代码Agent产品‘DeepSeek Code Harness’的研发,对标Claude Code和Codex;通过引入量化交易背景的崔添翼、模型结构专家徐名宇等关键人才补强Harness团队,并加速适配国产算力(如华为昇腾),旨在将大模型能力深度嵌入开发者真实工作流。
DeepSeek组建Harness团队,聚焦代码智能体产品开发,对标Claude Code;量化领域资深人才崔添翼(浙大校友、前Jane Street与TSY Capital核心成员)加盟该团队;公司正从纯模型研发转向商业化落地,强化模型与产品集成能力,加速AI Agent产品化。
文章聚焦AI Agent领域技术快速迭代下的核心能力建设,指出追逐新框架和benchmark是低效噪音,真正具备长期复利价值的是底层基础能力:Context Engineering、工具设计、eval体系、orchestrator-subagent模式、沙盒与harness思维。强调以结果为导向的实践路径、严苛的过滤标准(如两年后是否仍重要)、以及用交付作品替代传统资历的新职业逻辑。
文章聚焦AI产业从模型竞赛转向工程化落地的关键转折,提出Harness Engineering(约束工程)作为新核心范式,强调通过工具调度、工作流管理、Skills生态和AI原生组织提升大模型执行效率与商业化价值。阿里、腾讯、字节及MiniMax、智谱AI等正围绕Harness、Coding、Skills展开全面布局与竞争。
一个名为CLAUDE.md的Markdown配置文件登上GitHub热榜第一,内含Karpathy总结的四条AI编程行为准则,用于约束大模型在代码生成中的过度发挥、模糊决策和冗余修改等问题;该文件由开发者Jiayuan Zhang提炼实现,成为AI编程Agent的‘紧箍咒’,推动‘agentic engineering’实践落地。